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3 H 1 1 TTTTTTTGAGCAAAGGGCAACTCAGATATCC AAAG ATG AATC CAACAT ATA 5 1 



3H11 GCTTACAGCTGGGAGAACATTGTCTAACTCTTCTGAAATTTAAATGTTATC 102 



3H11 CAGAATCCTTCATCATAAAATAATATCAAAATGCAAATCTATTTTTTCTAC 153 



3H11 TCTTGTCTAGCTTCAACTTTCTTCTTCTGCTCATCAATTAGCAATTAATCC 204 

TGCTCATCAATTAGCAATTAATCC 



3H11 AAAACCATTATGGCTGCCAAAAATTCAGAGATGAAGTTTGCTATCTTCTTC 255 
2A 11 A ft AACr ATT ATf^nrTnCCA AAAATTCAG AGATGAAGTTTGCT ATCTTCTTC 
METAlaAlaLysAsnSerGluMETLysPheAlallePhePhe 



3 H 1 1 GTTGTTCTTTTGACGACCACTTTAGTTGATATGTCTGGAATTTCG AAAATG 306 
2 Al 1 GTTGTTCTTTTGACGACCACTTTAGTTGATATGTCTGGAATTTCGAAAATG 
ValValLeuLeuThrThrThrLeuValAspMETSerGlylleSerLyaMET 



*3H11 CAAGTGATGGCTCTTCGAGACATACCCCCACAAGAAACATTGCTGAAAATG 357 
2A11 CAAGTGATGGCTCTTCGAGACATACCCCCACAAGAAACATTGCTGAAAATG 
GlnValMETAlaLeuArgAspIleProProGlnGluThrLeuLeuLysMET 



3H11 AAGCTACTTCCCACAAATATTTTGGGACTTTGTAACGAACCTTGCAGCTCA 408 
2A1 1 AAGCTACTTCCCACAAATATTTTGGGACTTTGTAACGAACCTTGCAGCTCA 
LysLeuLeuProThrAsnlleLeuGlyLeuCysAsnGluProCysSerSer 



3H11 AACTCTGATTGCATCGGAATTACCCTTTGCCAATTTTGTAAGGAGAAGACG 4 59 
2A11 AACTCTGATTGCATCGGAATTACCCTTTGCCAATTTTGTAAGGAGAAGACG 
AsnSerAspCysIleGlylleThrLeuCysGlnPheCysLysGluLysThr 



3 H 1 1 GACCAGTATGGTTTAACAT ACCGTAC ATGCAACCTGTTGCCTTGAACAATA 510 
2A1 1 GACCAGTATGGTTTAACAT ACCGTACATGCAACCTGTTGCCTTGAACAATA 
AspGlnTyr'^lyLeuThrTyrArgThrCysAsnLeuLeuPro . 
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3H11 TCAATGATCTATCGATCGATCTATCTATCTATTTATCTGTCTCTGCGCGTA 561 
2A1 1 TCAATGATCTATCGATCGATCTATCTATCTATTTATCTGTCTCTGCGCGTA 



3H11 TAGTGTTGTCTGTACCTTTGGTGTGAAGAATATGAATAAAGGGATACATAT 612 
2 Al 1 TAGTGTTGTCTGTACCTTTGGTGTGAAGAATATGAATAAAGGGATACATAT 



3H1I ATCTAGATATATTCTAGGTAATGTCCTATTGTATTTAAAATTTGTAGCAAT 663 
2A1 1 AlCXafiATATATTCTAGGTAATGTCCTATTGTATTTAAAATTTGTAGCAAT 

3 H 11 GATTGTTTGAATAAAAACATACCATGAGTGAAATAATTATTCCACATTAAT 7 1 4 
2A1 1 GATTGTTTGAATAAAAACATACCATGAGTGAAATAATTATTCC 



3H11 TCACGTATTTATTTCACTTATGATACGTATTTTTGTTCCTTTCGCGTAAAA 765 
3H11 AAAAAAAAA 774 
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AATTCTTACA TTAATCTTAA TCATAATATA TACA GTT GAT ATG 

Val Asp MET 
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lie Pro Pro Gin Glu Thr Leu Leu Lys MET Lys Leu Leu 

2254 2263 2272 2281 

CCC ACA AAT ATT TTG GGA CTT TGT AAC GAA CCT TGC AGC 
Pro Thr Asn lie Leu Gly Leu Cys Asn Glu Pro Cys Ser 

2290 2299 2308 2317 

TCA AAC TCT GAT TGC ATC GGA ATT ACC CTT TGC CAA TTT 
Ser Asn Ser Asp Cys lie Gly He Thr Leu Cys Gin Phe 
2326 2335 2344 2353 2362 

TGT AAG GAG AAG ACG GAC CAG TAT GGT TTA ACA TAC CGT 
Cys Lys Glu Lys Thr Asp Gin Tyr Gly Leu Thr Tyr Arg 

2371 2380 2393 2403 

ACA TGC AAC CTG TTG CCT TGA ACAATATCAA TGATCTATCG 
Thr Cys Asn Leu Leu Pro 

2413 2423 2433 2443 2453 

ATCGATCTAT CTATCTATTT ATCTGTCTCT GCGCGTATAG TGTTGTCTGT 

2463 2473 2483 2493 2503 

ACCTTTGGTG TGAAGAATAT GAATAAAGGG ATACATATAT CTAGATATAT 

2513 2523 2533 2543 2553 

TCTAGGTAAt GTCCTATTGT ATTTAAAATT TGTAGCAATG ATTGTTTGAA 
. ' 2563 2573 2583 2593 2603 

TAAAAACATA CCATGAGTGA AATAATTATT CCACATTAAT TCACGTATTT 

2613 2623 2633 2643 2653 

ATTTCACTTA TGATACGTAT TTTTGTTCCT TTCGCGTAGA TTTTTGATCC 

2663 2673 2683 2693 2703 

TTTTCCCTTT TGAATATTAA ACATTAAACA CAAATAATGT TTATTAAATT 

2713 2723 2733 2743 2753 

AAGTTAATAT TTTTATTTAG CTATTTATAT TTTTATTTGA AATCAAACTT 

2763 2773 2783 2793 2803 

GATAAATATT TATAAAGATA ATTAACAAGT AATGTGACAC TAACACCATG 

2813 2823 2833 2843 2853 

TAATATTATC TTGTCGTTAT TTATGATAAT ATTTTAAAAT TATAATTTCA 

2863 2873 2883 2893 2903 

GTTAAAAAAT TATTAAAAAA ACATACTTTT AAAAAGTGAG TTAGCCTCCG 

2913 2923 2933 2943 2953 

CTACCCACAT ACTTATGAAT TGGACTAGTT GTTTTTTGAC CCACAAAAAG 

2963 2973 2983 2993 3003 

AATGGGCTAA TTAAACCTGA CCTATCAAAT TTCAGAATCT GCATAGATTA 
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3013 
GTCCGAACGA 

3063 
TTATGTAAAG 

3113 
TTCAATATCC 

3163 
TCATTAACTT 

3213 
ACTTACAGAA 

3263 
TTTAGTACTT 

3313 
AGTGAATTAA 

3363 
CTCAAGAACC 

3413 
AAGCGGAAGG 

3463 
ACTTTACAAG 

3513 
TCAACTAGCC 

3563 
TA^ATGCAAA 

3613 
TAATTGATAA 

3663; 
TGAGAAGTAA 
' -.,3713 
CTCGAACTCG 

3763 
ATGTCTCTGC 

3813 
ATGTACGAGT 
' 3863 
TGAATAAAAG 

3913 
ATAAGATACT 

3963 
ACTCAATGAA 

4013 
TCCCGACACT 

4063 
TCAGTATAAA 

4113 
AATAAGGGAT 



3023 
AATGAGTCAG 
3073 
ATGTTTAAGA 
3123 
CAACTTTGTC 
3173 
GTCTTGCTAT 
3223 
AATACATATA 
3273 
AAACTACATG 
3323 
ATTATCACAA 
3373 
AGTGCTGGTC 
3423 
CTAACTTAAG 
3473 
GTTTTAACAC 
3523 
ATAAAATA'GA 
3573 
ATATAGACTC 
3623 
AGATGGAAGT 
3673 
ATAAAATCCC 
3723 
GGGATATATC 
3773 
ATCATCAAAA 
3823 
ATGTAAGGGA 
3873 
GAAACATACT 
3923 
CAACTCAAAG 
3973 
GTACAAATTA 
4023 
CAACTGAACT 
4073 
GTAAAGTTGT 
4123 
ACAACATAAC 



3033 
CCCGTATTGA 
3083 
AGGAAAAAAG 
3133 
TGGCGATCTG 
3183 
GTATTTAAGA 
3233 
AATCTCTCAA 
3283 
AAAATTTAAA 
3333 
TCCGAGCCTA 
3383 
CCCAAGCTAA 
3433 
TATACAAAAG 
3483 
AAATGAACAA 
3533 
CAACTTTAGT 
3583 
CTTAACTAAA 
3633 
CGGGACAAGA 
3683 
CCGGAAAAAA 
3733 
AATGAAGCTC 
3783 
AGATGCAGGC 
3833 
AATTCTAAAG 
3883 
TACCTCTTTT 
3933 
ATTAGGTATT 
3983 
ACTCAGGATA 
4033 
CATTTCAATA 
4083 
TTAAAAACAT 
4133 
TTTGAAATGT. 



3043 
ACAAAATATC 
3093 
ATTTCTAATA 
3143 
AACCCTGCTT 
3193 
TTTAAACTTT 
3243 
GACTTGGCAA 
3293 
TATCCTTTTA 
3343 
CACCTTGGAC 
3393 
CCCTCATCCT 
3443 
CTTAAAACTG 
3493 
CTTTGAAGAA 
3543 
CTTTAAAACA 
3593 
CTGACTATCf 
3643 
CCACGACATC 
. . 3693 
AGGAGCCTCA 
3743 
CTGTTGATGA 
3793 
CAAATGGCTC 
3843 
TATAACATAA 
3893 
CAACTGAACT 
3943 
CAACGCAAAT 
3993 
CTCGACTTAA 
4043 
TAAAGCAGCT 
4093 
GATGTCAACT 
4143 
ATATAAAAAT 



3053 
AACAAGGACG 
3103 
CATATGGACT 
3153 
AGTTTGTTGA 
3203 
ATATGTTTAA 
3253 
CATAATTTAC 
3303 
ACATCTTTGA 
3353 
GTGGCCGGCA 
3403 
GACTGACTAC 
3453 
AATAAAATAA 
3503 
AATAATATAT 
3553 
TTTAATAAAA 
3603 
ATGGAGCCTC 
3653 
CTGACTAAAC 
3703 
CCATGGCTAA 
3753 
TCTTGAAGAC 
3803 
AGTACGTAAA 
3853 
GCTTGATACT 
3903 
CAAATTAAGA 
3953 
ATGGCACTCT 
4003 
GATACTCAAC 
4053 
TAAAACAAGT 
4103 
CTGTGTGTAT 
4153 
ACAATTAACT 
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416. 


4173 


4183 


4193 


4203 


GATGTATATA 


AAAATACATT 


AATCTATGGG 


AGATTCTCTA 


ACCGACAACC 


4213 


4223 


4233 


4243 


4253 


ATCACTTAAG 


GGCTAAGATG 


ATGATATAGC 


GATCTACCGC 


ACGCTGCCAT 


4263 


4273 


4283 


4293 


4303 


CGCATCTTAT 


ACCCGGCCAA 


AGGTATAAGA 


CCTGAACTGC 


CTAATGAATC 


4313 


4323 


4333 


4343 


4353 


CACTAATAAA 


CTGTTAAAAG 


GAATCATCTA 


AAAAGTATGA 


CCCTTTTCTA 


4363 


4373 


4383 


4393 


4403 


CCCATAGTGG 


CTAACATGGt 


TTATGGGGGC 


TGTGAGTTAT 


CTGAACTCTC 


4413 


4423 


4433 


4443 


4453 


CCCCATATCG 


GTGCTCAATA 


CTACTCCAAA 


AAATATACTG 


CTCTTATGTT 


4463 


4473 


4483 


4493 


4503 


TAAAAACATA 


CTGATTCTGT 


GGTTTGAAAT 


TATTGCTTAA 


AGCTTAGATT 


4513 


4523 


4533 


4543 


4553 


TTTGAAAAGC 


TCTCTTTTGA 


AAATCGTAGT 


TTCCTTTTTC 


TTCTATTAAA 


4563 


4573 


4583 


4593 


4603 


GCTAGACATA 


GGCTATGTAG 


AACTCTAGCT 


TACCTTCCTT 


CTCAAAAGTT 


4613 


4623 


4633 


4643 


4653 


TGAAAACATT 


TGCTTAGATT 


CTTAGGGACT 


ACTTAGTTCC 


CTTGTTGGAA 


TTC 
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PG GENOMIC 



10 



20 



30 



40 



50 



AAGCTTCTTA AAAAGGCAAA. TTGATTAATT TGAAGTCAAA ATAATTAATT 

60 70 80 90 100 

ATAACAGTGG TAAAGCACCT TAAGAAACCA TAGTTTGAAA -GGTTACCAAT 

110 120 130 140 150 

GCGCTATATA TTAATCAACT TGATAATATA AAAAAAATTT CAATTCGAAA 

160 170 180 190 200 

AGGGCCTAAA ATATTCTCAA AGTATTCGAA ATGGTACAAA ACTACCATCC 

210 220 230 240 250 

GTCCACCTAT TGACTCCAAA ATAAAATTAT TATCCACCTT TGAGTTTAAA 

260 270 280 290 300 

ATTGACTACT TATATAACAA TTCTAAATTT AAACTATTTT AATACTTTTA 

310 320 330 340 350 

AAAATACATG GCGTTCAAAT ATTTAATATA ATTTAATTTA TGAATATCAT 

360 370 380 390 400 

. TTATAAACCA ACCAACTACC AACTCATTAA TCATTAAATC CCACCCAA^.T. 

410 420 430 440 450 

TCTACTATCA AAATTGTCCT AAACACTACT AAAACAAGAC GAAATTGTTC 

460 470 480 490 500 

GAGTCCGAAT CGAAGCACCA ATCTAATTTA GGTTGAGCCG CATATTTAGG 

510 520 530 540 550 

AGGACACTTT CAATAGTATT TTTTTCAAGC ATGAATTTGA AATTTAAGAT 

560 570 580 590 600 

TAATGGTAAA GAAGTAGTAC ATCCCGAATT AATTCATGCC TTTTTTAAAT 

610 620 630 640 650 

ATAATTATAT AAATATTTAT GATTTGTTTT hAM:AT:7PAA ACTTGAATAT 

660 670 680 690 700 

ATTATTTTTT TAAAAATTAT CTATTAAGTA CCATCACATA ATTGAGACGA 

710 720 730 740 750 

AGGAATAATT AAGATGAACA TAGTGTTTAA TTAGTAATGG ATGGGTAGTA 



FIGURE 8A 




760 



770 



780 



790 



800 



AATTTATTTA TAAATTATAT CAATAAGTTA AATTATAACA AATATTTGAG 

810 820 830 840 850 

CGCCATGTAT TTTAAAAAAT -ATTAAATAGT TTGAATTTAA AACCGTTAGA 

860 870 880 890 900 

TAAATGGTCA ATTTTGAACC CAAAAGTGGA TGAGAAGGGT ATTTTAGAGC 

910 920 930 94p ' 950 

CAATAGGRGG ATGAGAAGGA TATTTTGAAG CCAATATGTG ATGGATGAAG 

960 970 980 990 1000 

GATAATTTTG TATCATTTCT AATACTTTAA AGATATTTTA GGTCATTTTC 

1010 1020 1030 1040 1050 

CCTTCTTTAG TTTATAGACT ATAGTGTTAG TTCATCGAAT ATCATCTATT 

1060 1070 1080 1090 1100 

ATTTCCGTCT TAAATTATTT TTTATTTTAT AAATTTTTTA AAAATAAATT 

1110 1120 1130 1140 1150 

ATTTTTTCCA TTTAACTTTG ATTGTAATTA ATTTTTAAAA ATTACCAACA 

1160 1170'-^ 1180 1190 1200 

TATAAATAAA ATTAATATTT AACAAAGAAT TGTAACATAA TATTTTTTTA 

1210 1220 1230 1240 1250 

ATTATTCAAA ATAAATATTT TTAAACATCA TATAAAAGAA ATACGACAAA 

1260 1270 1280 1290 1300 

AAAATTGAGA CGGGAGAAGA CAAGCCAGAC AAAAATGTCC AAGAAACTCT 

1310 1320 1330 1340 1350 

TTCGTCTAAA TATCTCTCAT CCAAACTAAT ATAATACCCA TTATAATTAA 

1360 1370 1380 1390 1400 

CCATATTGAC CAACTCAAAC CCCTTAAAAT CTATAAATAG ACAAACCCTT 

1410 1420 1430 1440 1450 

CCCATACCTC TTATCATAAA AAAAATAATA ATCTTTTTCA ATAGACAAGT 

1460 1470 1480 1490 1500 

TTAAAAACCA TACCATATAA CAATATATCA TGGTTATCCA AAGGAATAGT 
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1510 1520 1530 1540 1550 

ATTCTCCTTC TCATTATTAT TTTTGCTTCA TCAATTTCAA CTTGTAGAAG 

1560 1570- 1580 1590 1600 

CAATGTTATT GATGACAATT TATTCAAACA AGTTTATGAT AATATTCTTG 

1610 1620 1630 1640 " 1650 

AACAAGAATT TGCTCATGAT TTTCAAGCTT ATCTTTCTTA TTTGAGCAAA 

1660 1670 1680 1690 " 1700 

AATATTGAAA GCAACAATAA TATTGACAAG GTTGATAAAA ATGGGATTAA 

1710 1720 1730 1740 1730 

AGTGATTAAT GTACTTAGCT TTGGAGCTAA GGGTGATGGA AAAACATATG 

1760 1770 1780 1790 1800 

ATAATATTGT AAGTATTTAA ATATTGGAAT ATATTTGTGG GGATGAAAAT 

1810 1820 1830 1840 1850 

GATAGAGAAT ATAAGAATTA TTTGGAAGGA TGAAAAGTTA TATTTTATAA 

I860 1870 1880 1890 1900 

AGTAGAAAAT TATTTTCTCG TTTTTAGTAA TTAAAGGTGA AAAATGAGTT 

1910 192.0 1930 1940 1950 

TTCTCGTAAG CGAGGAAAGT CATTTTCCAT GGAACTGTAT TTTTTTTTTA 

1960 1970 1980 1990 2000 

CTTTTAATAA CGTCATAGTA TTTGCTATAC TCAAGAATAA GACACTATTA 

2010 2020 2030 2040 2050 

TTGATGTTTA GTGCTCGAAA AGAAATTGAT AGTAATTTTG CTAATATAAC 

2060 2070 2080 2090 2100 

TATCAATTTC TTATATGTAT ATTTTTCAAC CAAAATAACA AAGCGTAATC 

2110 2120 2130 2140 2150 

CAATAAGTGG GCCTCTAGAA TAAAGAGTAA GTTCTATTAA TTCTTAACCT 

2160 2170 2180 2190 2200 

TATTTAATTT TATGGAAACC TCGACAAAAC GACAATGCTC AACTTATATT 



CGAATTC 
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